Nat Neurosci:全基因组测序和多组学数据的整合揭示了结构变异对人脑基因调控的影响
结构变异(SVs)是基因组的重排,范围从50个到数千个碱基对(bp)。近年来由于全基因组测序(WGS)的发展,检测到的SVs的数量大量增加。虽然SVs和脑疾病十分相关,然而之前的大多数关于SVs影响的研究都局限于非脑组织或mRNA的表达水平,缺乏脑组织以及其他分子水平的研究。
因此,Towfique教授团队整合了衰老研究队列的1760个受试者的WGS数据以及脑组织的包含了组蛋白乙酰化,染色质免疫共沉淀,RNA测序,蛋白质组学等多组学的数据来揭示SVs是如何调节人类大脑的功能和疾病风险(图1),并于2022年3月在Nature Neuroscience 杂志发表了题为Integrating whole-genome sequencing with multi-omic data reveals the impact of structural variants on gene regulation in the human brain 的文章。
图1.研究概况
欢迎加入
全国ADPD学术讨论群
全国神经内科学术讨论群
添加小编微信
brainnews_11
-留言:ADPD、神经内科研究群-
SVs的发现与质量评估
该团队对来自ROS/MAP, MSBB以及Mayo衰老队列的1881个受试者进行短读WGS,检测了SVs中的删除(DELs),复制(DUPs),插入(INSs),倒位(INVs),移动元件插入(MEIs)以及复杂重排(CPXs),最后在1760个样本中获得了170966个高可信度的SVs(图2.a),SVs的bp越大,数量就越小,且在MEIs中发现较多的Alu, SVA以及LINE1(图2.b)。
为了评估这些发现的SVs,将这些SVs与之前的多个基因数据库对比,发现她们的可重复性比较高,并且有30%左右的新SVs(图2.c),此外,使用ROS/MAP数据库中的2个样本进行长读WGS,其结果和之前短读WGS有很高的一致性(图2.d)。
图2.队列中发现的SVs
SVs对基因表达的影响
该团队对发现的常见SVs进行了不同脑区的顺式-表达数量性状位点(cis-eQTL)分析(图3.a),发现DEL和SVA更有可能和基因表达改变相关(图3.b),长非编码RNA,TEC以及假基因与SVs的相关性的总体效应要大于蛋白编码基因(图2.c),除了与外显子有重合的部分外,SV-eQTL的效应方向基本都是两侧分布(图2.e)。
不同脑区的比较显示98%的SV-eQTL效果方向相同,但是也能看出一定的区域特异性(图2.f)。为了推测每个位点的SVs的可能的因果关系,该团队对ROS/MAP队列中的发现的SVs和单核苷酸多态性(SNPs)进行了联合eQTL以及精准映射(mapping),发现有86/2518(3.41%)SVs比SNPs有更高或者相同概率的因果性(图2.g-i)。
图3.SV-eQTLs的特性
影响基因调控级联反应的
SVs的mapping
该团队之后对ROS/MAP队列背外侧前额叶(DLPFC)中发现的25421个最小等位基因频率(MAF)≥ 0.01的SVs进行了蛋白(pQTL),剪切(sQTL),表达(eQTL),以及组蛋白(HaQTL)的SV-xQTL分析,发现了3191 SV-eQTLs,2866 SV-sQTLs,399 SV-pQTLs以及1454 SV-haQTLs(图4.a)。
结果显示,DEL在各个水平的表型,ALU在pQTL 和eQTL ,SVA在pQTL,eQTL以及sQTL都出现明显的相关(图4.b)。此外,SV-xQTL在基本所有的分子表型的相关功能注释中富集(图4.c)。该团队同时发现了667对SV基因与至少两种表型相关的效应,发现pQTL和eQTL之间的相关性比较强,但是也会出现eQTL降低,pQTL升高的现象(图4.d-f)。
图4. SVs对基因调控级联反应的影响
之后该团队使用中介分析(将mRNA或者蛋白作为结果,其他表型作为介质)来研究SV-xQTL之间的影响,分为完全中介(SV影响表型M,表型M影响Y),部分中介(SV影响表型M,表型M影响Y同时SV也影响Y)以及co-local(SV独立地影响两种表型)(图5.a),结果显示,组蛋白和选择性剪切对于RNA的效应要比蛋白强(图5.b和c),完全中介出现的情况非常少,但是也有存在(图5.d)。
图5.SV-xQTL的中介分析
罕见SVs的影响
由于罕见SVs的频率很低,其影响通常是通过在异常值内寻找富集物来间接测量,而不是上述标准的关联测试。该团队发现了1551和1747对RNA表达和蛋白水平有影响的异常值对(图6.a),此外对罕见SVs进行富集发现DEL和DUP在RNA中富集更明显(图6.b),对RNA和蛋白的影响效应的方向也一致(图6.c),虽然也会出现相反的情况(图6.d)。
图6.罕见SVs对基因表达异常值的影响
神经退行性疾病中的
致病性SVs的特征
由于SVs之前并不纳入到全基因组关联分析研究中,因此它们和神经退行性疾病的关系很多都被忽视了。该团队进行了全基因组SV与阿尔茨海默病以及进行性核上麻痹(PSP)的关联分析,发现了4个与PSP相关的SVs,它们与很多PSP相关的基因表达和分子表型相关(图7)。
图7.与PSP相关的SVs以及它们对分子表型的影响
结 论
基因的SVs可以影响基因调控级联反应,研究它们与神经退行性疾病的相关性可以进一步理解神经系统疾病的机制。
参考文献
Ricardo A, et al. Integrating whole-genome sequencing with multi-omic data reveals the impact of structural variants on gene regulation in the human brain. Nature Neuroscience. 2022. DOI: 10.1038/s41593-022-01031-7.
编译作者:KK(brainnews创作团队)
校审:Simon(brainnews编辑部)